首页> 外文OA文献 >Lexicon plus TX: Rapid construction of a multilingual lexicon with under-resourced languages
【2h】

Lexicon plus TX: Rapid construction of a multilingual lexicon with under-resourced languages

机译:Lexicon plus TX:使用资源不足的语言快速构建多语言词典

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Most efforts at automatically creating multilingual lexicons require input lexical resources with rich content (e.g. semantic networks, domain codes, semantic categories) or large corpora. Such material is often unavailable and difficult to construct for under-resourced languages. In some cases, particularly for some ethnic languages, even unannotated corpora are still in the process of collection. We show how multilingual lexicons with under-resourced languages can be constructed using simple bilingual translation lists, which are more readily available. The prototype multilingual lexicon developed comprise six member languages: English, Malay, Chinese, French, Thai and Iban, the last of which is an under-resourced language in Borneo. Quick evaluations showed that 91.2 % of 500 random multilingual entries in the generated lexicon require minimal or no human correction.
机译:自动创建多语言词典的大多数工作都要求输入的词典资源具有丰富的内容(例如语义网络,域代码,语义类别)或大型语料库。此类材料通常不可用,而且对于资源贫乏的语言很难构建。在某些情况下,尤其是对于某些民族语言,即使没有注释的语料库也仍在收集中。我们展示了如何使用简单的双语翻译列表来构建资源不足的语言的多语言词典,而这些列表更容易获得。开发的原型多语言词典包含六种成员语言:英语,马来语,中文,法语,泰语和伊班语,最后一种是婆罗洲资源贫乏的语言。快速评估显示,在生成的词典中,有500个随机多语言条目中的91.2%需要极少或不需要人工纠正。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号